這次 Machine Learning with TensorFlow on Google Cloud Platform 的課程中,如 Day1 提到的,共有 5 個子課程:
今天就來整理這次鐵人賽的文章,也方便日後自己或是想參考的人可以快速查找相關的主題。
這個部分主要在了解ML的商用方式和過程,並且知道何時該使用ML以及在GCP上使用的優點。
這個部分主要在了解ML的基礎知識,包含術語、模型的優化、模型泛化的重要性和訓練模型時分割資料的方式與必要性。
這個部分主要在了解 TensorFlow 的運作和程式撰寫,並且如何結合 GCP 來做到規模化、分散式的模型訓練。
tf.get_variable()
與 tf.placeholder()
之間的差異這個部分主要在了解特徵工程的重要性與做法,並且透過 GCP 來達到規模化、快速、一致的資料前處理。
tf.transform
來實作特徵處理和特徵建立
這個部分主要在了解ML訓練當中一些重要的關鍵點如超參數,神經網路的概念和嵌入方法的強大。
Day # | Lab # | 主旨 |
---|---|---|
Day2 | --------- | 簡介如何使用ML商用化的方式 |
Day3 | --------- | 了解 Google 所謂的 AI-first 策略是什麼意義 |
Day4 | --------- | 了解 Google 在使用ML商用化的經驗與知識 |
Day5 | Lab 1 | 介紹雲端開發環境,Google Cloud Platform (GCP) |
Day6 | Lab 2, 3 | 介紹雲端開發環境,Cloud Datalab |
Day7 | --------- | 了解在ML中所會提到的術語以及重要知識 |
Day8 | --------- | 了解模型是怎麼優化的 |
Day9 | Lab 4 | 了解泛化和取樣的重要 |
Day10 | Lab 5 | 了解資料的探索和分割 |
Day11 | --------- | 介紹 TensorFlow 的核心元件 |
Day12 | Lab 6 | 透過實作了解 TensorFlow |
Day13 | Lab 7 | 了解Estimator API並實際操作 |
Day14 | Lab 8 | 了解遇到巨大資料集時如何訓練模型 |
Day15 | Lab 9 | 了解何時需要分散式訓練以及如何使用 |
Day16 | Lab 10 | 了解如何在GCP訓練、監測和部署ML模型 |
Day17 | Lab 11 | 了解特徵工程的領域有哪些 |
Day18 | Lab 12 | 了解前處理和特徵建構的做法 |
Day19 | Lab 13 | 了解如何大規模的執行 data pipeline |
Day20 | Lab 14 | 了解如何使用 Cloud Dataprep 做資料前處理 |
Day21 | Lab 15 | 了解特徵組合的目的與做法 |
Day22 | Lab 16 | 了解如何使用 tf.transform 來實作特徵處理和特徵建立 |
Day23 | Lab 17 | 了解ML裡面的藝術如正規化、學習率和批次大小 |
Day24 | Lab 18 | 了解超參數與如何調整其值 |
Day25 | --------- | 深入了解正規化和邏輯迴歸 |
Day26 | Lab 19 | 了解和訓練神經網路 |
Day27 | --------- | 認識 Embedding |
Day28 | Lab 20 | 了解如何撰寫客製化 Estimator |
今天總結了前面所有鐵人賽中,課程的學習內容,明天是最後一天,就來寫寫這次參賽的心得感想吧!